AI Intelligence Navigator · 2026-05-05

每天 5 分钟，知道 AI 圈真正值得看的变化。

每天 5 分钟，读懂 AI 圈真正值得看的变化。这里不是原始链接仓库，而是经过清洗、去重、归类和价值判断的 AI 信息导航站。

看今日要闻浏览全部资料

565精选条目

484全文备份

7主题频道

112近期信号

Agent 与自动化 4.0 · 优秀

MCP-Flow: 自动构建大规模 MCP 工具数据集，让 0.6B 模型在工具调用上超越 GPT-4o

MCP-Flow 提出全自动 pipeline，从 6 个 MCP 市场自动抓取服务器配置，通过 Slot-Fill Revision + WizardLM Evolution 两阶段数据增强，产出 68733 对 instruction-function call（1166 服务器、11536 工具）。实验表明：GPT-4o 在 10 工具场景下 AST 仅 58.8%，100 工具时 Groq-8B AST 跌至 3%；而 MCP-Flow-Qwen3-0.6B 在同场景下 AST 达 81.2%，全面超越所有大模型。用 MCP-Flow 做 RAG 检索增强后，GPT-4o 在 GAIA 任务上成功率 +17%，步数减少 32%。

先看它的理由0.6B 小模型微调后在 MCP 工具调用上全面超越 GPT-4o，证明小模型+数据工程才是正确方向

mcptool-callingfine-tuningdatasetagent

Today

今日要闻

Coding 4.0 · 优秀

Greg Brockman 详解 Codex 验证创业想法的 Skill

Greg Brockman 分享了一个 Codex Skill，可以对创业想法进行压力测试。用户只需输入创业想法，Codex 会自动找到核心假设、暴露致命缺陷、检查问题是否真实存在，并给出坦诚的批判性评估。这个 Skill 解决了一个常见痛点：大多数创业想法听起来都不错，但缺乏系统性的验证机制。对于独立开发者、天使投资人以及正在构思 MVP 的创业者，这个工具提供了一个低成本的初期验证手段，可以快速筛选出想法中的致命漏洞。

2026-05-04 · X · gdb

Models 5.0 · 必读

Google Gemini Embedding 2 多模态嵌入模型

Google推出的首个原生多模态嵌入模型，支持视频分析、视觉购物助手等多种应用场景，已向公众开放使用。

2026-05-03 · X · GoogleAI

Business 4.0 · 优秀

Pete Yang对话前Tinder CPO：构建AI产品的3层context系统

Pete Yang 与前 Tinder CPO Ravi Mehta 合作，提出构建有用 AI 产品的3层 context 系统：Functional 层（应用做什么）、Visual 层（应用长什么样）和 Context 层（当前交互上下文）。Pete 指出目前 AI 使用中最常见的错误是不主动管理 context——模型无法有效利用历史信息，导致输出质量下降。这套3层框架可帮助产品经理和开发者系统性地设计 AI 产品的信息架构，避免常见的信息流混乱问题，是一个可复用的产品方法论。

2026-05-03 · X · petergyang

Agents 3.0 · 值得看

OpenClaw 2026.5.2：插件安装更稳、Agent 热路径更轻

Peter Steinberger 转发 OpenClaw 2026.5.2 发布，重点是修复 npm 安装依赖与速度问题，让插件安装和更新更稳定，并把大部分能力迁入 extensions 以降低包体负担。发布同时提到 Gateway 与 agent hot path 精简，以及 Discord、Slack、Telegram、WhatsApp、TTS、Realtime、web search 等集成修复。

2026-05-03 · X · steipete

Coding 5.0 · 必读

Tibo独家复盘:9次失败产品后如何做到100万美金/月五款AI产品从0到1方法论

独立开发者 Tibo 复盘5款AI产品做到100万美金/月快速验证快速失败是核心

2026-05-02 · X · petergyang

Business 4.0 · 优秀

OpenAI CFO Sarah Friar：建议将 IPO 推迟至 2027 年，正在管理 Sam Altman

华尔街日报对 OpenAI CFO Sarah Friar 的深度专访。知情人士透露，Friar 私下建议将 OpenAI IPO 推迟至 2027 年，以避免在 Anthropic 之前匆忙上市导致估值受损。她帮助维持了 OpenAI 与微软的关键合作关系，并正在管理 Sam Altman 的雄心与公司实际发展节奏之间的平衡。报道指出 OpenAI 正处于 11 年历史上最关键的发展阶段，走得太快可能透支业务，太慢则可能被 Anthropic 抢先。

2026-05-02 · 文章 · Lauren Thomas / Wall Street Journal

Models

模型与实验室

进入频道

GPT、Claude、Gemini、开源模型、模型能力边界。

5.0 · 必读

Google Gemini Embedding 2 多模态嵌入模型

Google推出的首个原生多模态嵌入模型，支持视频分析、视觉购物助手等多种应用场景，已向公众开放使用。

2026-05-03 · X · GoogleAI

4.0 · 优秀

xAI 发布 Grok 4.3：常驻推理、100万上下文、超低定价，附带语音克隆套件 Custom Voices

xAI 发布 Grok 4.3 模型，主打"常驻推理"（always-on reasoning）能力，具备 100 万 token 上下文窗口，API 定价仅为 Grok 4.20 的 60%（输入 $1.25/百万token，输出 $2.50/百万token）。在 Artificial Analysis Intelligence Index 上比 Grok 4.20 提升 4 分，以 500B 参数超越 Claude Sonnet 4.6。同时发布 Custom Voices 语音克隆套件，仅需 1 分钟语音样本即可生成可用的语音克隆。xAI 工程师表示更大规模的模型正在训练中。

2026-05-01 · 文章 · xAI

3.0 · 值得看

深度调研：Claude Code 最强配置单 · 9 个 GitHub 工具深度评测

调研时间： 2026-04-16 调研人： AI 助理（Subagent）主题分类： AI 开发工具 / Claude Code 生态 --- Claude Code 已成为当前 AI 辅助编程的事实标准，而其真正的威力取决于周边工具链的搭配质量. 本次调研覆盖 9 款 GitHub 上与 Claude Code 强相关的工具与插件，按功能分为知识增强、技能增强、自动化设计三类. 核心结论：Superpowers 和 GSD 是本次评测中唯二达到"必装"标准的工具——前者重塑了软件工程的纪律与方法论，后者用原子化 subagent 执行模型根治了长会话

2026-05-01 · 文章

Agents

Agent 与自动化

进入频道

Agent 框架、MCP、A2A、工具调用、长期任务。

4.0 · 优秀

MCP-Flow: 自动构建大规模 MCP 工具数据集，让 0.6B 模型在工具调用上超越 GPT-4o

2026-05-04 · 论文 · TikTok & 上海交大联合研究

3.0 · 值得看

OpenClaw 2026.5.2：插件安装更稳、Agent 热路径更轻

2026-05-03 · X · steipete

3.0 · 值得看

Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents

Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents 英文原文 Introducing Koog Integration for Spring AI: Smarter Orchestration for Your Agents > 作者: @jetbrains > 发布时间: 2026-04-16 > 原文链接: --- ## JetBrains AI Supercharge your tools with AI-powered features inside many JetBrains products Follow - Follow: - _RSS_ RSS Explore More # Introducing Koog Integr...

2026-05-01 · 文章

Coding

AI 编程

进入频道

IDE、CLI、代码审查、工程工作流、开发者效率。

4.0 · 优秀

Greg Brockman 详解 Codex 验证创业想法的 Skill

2026-05-04 · X · gdb

5.0 · 必读

Tibo独家复盘:9次失败产品后如何做到100万美金/月五款AI产品从0到1方法论

独立开发者 Tibo 复盘5款AI产品做到100万美金/月快速验证快速失败是核心

2026-05-02 · X · petergyang

3.0 · 值得看

Claude Code 向 Codex 的习惯迁移

串串狗小刊发布的一篇从 Claude Code 迁移到 Codex 的实践指南。文章对比了两个 AI 编程工具在日常使用中的差异，包括上下文管理、工具调用方式、权限模型等方面的区别，并分享了作者在实际项目中完成迁移的经验和踩坑记录。对于同时使用或考虑切换 AI 编程工具的开发者有直接参考价值。（原文抓取失败，基于 RSS 元数据提取）

2026-05-02 · 文章 · 串串狗小刊

Infra

基础设施

进入频道

推理、RAG、微调、评测、多模态、芯片和端侧部署。

3.0 · 值得看

Anthropic 正在与英国 AI 芯片初创 Fractile 洽谈采购推理芯片

据 The Information 报道，Anthropic 正在与英国 SRAM 基 AI 芯片初创公司 Fractile 进行早期洽谈，计划在 2027 年 Fractile 产品上市后采购其推理芯片。随着 Anthropic 销售额爆发式增长，现有服务器供应（来自 Google、Amazon、Nvidia）已面临压力。此举反映了 AI 公司正在积极多元化芯片供应链，以应对日益增长的推理算力需求。Fractile 的 SRAM 基方案代表了一种不同于传统 GPU 的推理加速路径。

2026-05-02 · 文章 · The Information

4.0 · 优秀

三星芯片利润暴涨近 50 倍至 53.7 万亿韩元，预警 2027 年供应缺口将进一步扩大

三星电子 Q1 营业利润 57.2 万亿韩元（约 386 亿美元），创历史新高，半导体部门贡献 53.7 万亿韩元，利润率超 70%，超过英伟达和台积电同期。三星已签多年期约束性合同锁定产能，警告 2027 年存储芯片供需缺口将比 2026 年更大。AI 数据中心对 HBM 的需求是核心驱动力。

2026-04-30 · 文章 · Reuters / Bloomberg

4.0 · 优秀

华为昇腾 AI 芯片 2026 年营收预计达 120 亿美元，同比增长 60%

华为预计 2026 年 AI 芯片营收约 120 亿美元，同比增长 60%。下一代昇腾 950PR 已进入量产，DeepSeek V4 发布后字节跳动、腾讯、阿里加速抢购。华为计划今年出货约 75 万颗 950PR。黄仁勋此前警告：如果 DeepSeek 新模型率先在华为芯片上全面适配，对美国在全球 AI 领域的战略地位将是灾难性打击。

2026-04-28 · 文章 · FT / HeyGoTrade

Business

产品与商业

进入频道

AI 产品、大厂战略、融资、监管、市场结构。

4.0 · 优秀

Pete Yang对话前Tinder CPO：构建AI产品的3层context系统

2026-05-03 · X · petergyang

4.0 · 优秀

OpenAI CFO Sarah Friar：建议将 IPO 推迟至 2027 年，正在管理 Sam Altman

2026-05-02 · 文章 · Lauren Thomas / Wall Street Journal

3.0 · 值得看

马斯克诉 OpenAI 案首周遭遇波折

马斯克对 OpenAI 的诉讼在首周审理中遭遇波折。据彭博社报道，庭审过程中出现多个不利信号。这起备受关注的案件被视为 AI 行业治理走向的风向标，涉及 OpenAI 从非营利向营利转型的合法性、创始团队的信义义务等核心问题。案件的走向将对整个 AI 行业的公司治理结构产生深远影响。

2026-05-02 · 文章 · Bloomberg

Research

研究与学习

进入频道

论文、课程、提示工程、长文、方法论。

5.0 · 必读

Andrew Ng新课：AI Prompting for Everyone

吴恩达（Andrew Ng）指出2026年的 Prompt 技巧与2022年 ChatGPT 刚发布时已截然不同。他新推出课程「AI Prompting for Everyone」，旨在帮助各种技能水平的用户成为AI power user。课程覆盖跨 ChatGPT、Gemini、Claude 等主流模型的通用 Prompt 技巧，强调如何针对不同模型特性优化 Prompt 策略。对于想系统提升 AI 使用效率的读者，这门跨模型的通用方法论比单一工具教程更有长期价值。

2026-05-01 · X · AndrewYNg

4.0 · 优秀

深度研究Prompt方法论：横纵分析法

原文链接：作者：Khazix0918 日期：2026-04-14 抓取时间：2026-04-14 12:00

2026-04-14 · X · Khazix0918

5.0 · 必读

Android 17 DeliQueue：二十年来最重要的消息队列架构重写

Android 17用lock-free混合数据结构DeliQueue替换了存在20年的MessageQueue实现。实际用户设备上实现丢帧率降低4%-7.7%、应用启动速度提升9.1%。这不是Binder IPC改造，而是对Android所有UI线程运行核心——Looper/Handler消息调度机制的根本性重构。每个应用的main线程、SystemUI、Launcher乃至system_server中的HandlerThread都依赖MessageQueue，这个单点性能改进具有全局传导效应。面向SDK 37及以上默认启用。

2026-04-10 · 文章 · Shai Barack, Charles Munger (Google)

Tools

工具与项目

进入频道

可直接尝试的工具、开源项目、产品更新和资源库。

4.0 · 优秀

OpenAI DevDay门票抽奖

使用GPT-5.5和Image Gen构建项目，每周选出2-3个最佳项目赢得免费DevDay 2026门票，提供实践AI前沿技术的机会。

2026-05-01 · X · OpenAI

3.0 · 值得看

深度调研：DroidClaw vs Open-AutoGLM

调研时间：2026-04-12 > 耗时：约 15 分钟 > 类型：对比分析（开源 Android AI Phone Agent） DroidClaw 和 Open-AutoGLM 是 2025-2026 年两个最具代表性的开源 Android AI Phone Agent 项目，均通过「感知屏幕 → LLM 推理 → ADB 执行」的循环实现手机自动化. 但二者在架构哲学、感知方式、模型策略、生态定位上差异显著：DroidClaw 走「轻量实用主义」路线——Bun/TypeScript、accessibility tree 为主、任意 LLM、旧机复用；O

2026-05-01 · 文章

3.0 · 值得看

从历史 Luddites 看反 AI 数据中心运动：1816 年的教训

Source: Sean Goedecke | 2026-04-23 URL: com/luddites-and-ai-datacenters/ > 注：原文抓取失败，此内容基于 RSS 摘要整理. Sean Goedecke's detailed analysis of historical Luddism based on multiple historical texts. Real Luddites were skilled craftspeople (7-year apprenticeships) whose trade was being

2026-05-01 · 文章

Deep Reads

深度阅读

全部

Agents 2026-05-04 · 论文

MCP-Flow: 自动构建大规模 MCP 工具数据集，让 0.6B 模型在工具调用上超越 GPT-4o

mcptool-callingfine-tuningdatasetagentsmall-model

4.0 · 优秀开发者

Business 2026-05-02 · 文章

OpenAI CFO Sarah Friar：建议将 IPO 推迟至 2027 年，正在管理 Sam Altman

OpenAIIPOSarah Friar财务策略

4.0 · 优秀产品/创业

Business 2026-05-01 · 文章

Meta 收购机器人 AI 初创 Assured Robot Intelligence，加入超级智能实验室

Meta 收购了 Assured Robot Intelligence（ARI），一家专注于为机器人开发 AI 模型的初创公司。ARI 团队将加入 Meta 超级智能实验室（MSL），与 Lerrel Pinto、Xiaolong Wang 等共同推进人形机器人智能。ARI 联合创始人表示，目标是将"能思考和说话的 AI"转变为"能行动的 AI"，在物理世界中安全可靠地协助人类。此举是 Meta 在裁员 8000 人的同时加码物理 AI 和人形机器人赛道的重要布局。

Meta机器人人形机器人收购ARI

4.0 · 优秀产品/创业

Business 2026-04-30 · 文章

哈佛研究：OpenAI o1 在急诊分诊中正确率 67%，超越医生的 50-55%

发表在 Science 上的哈佛研究显示，OpenAI 的 o1 推理模型在真实急诊场景中使用电子病历和护士简短描述进行诊断，正确率达到 67%，而分诊医生仅为 50-55%。在管理计划方面，AI 得分 89% 远超医生的 34%。研究者称这是"将重塑医学的深刻技术变革"，但也强调 AI 应作为辅助工具而非替代医生，呼吁进行更大规模的前瞻性临床试验。论文同期被 NPR、Vox、CNET 等多家主流媒体广泛报道。

AI医疗OpenAIo1急诊诊断Science论文

5.0 · 必读产品/创业

Infra 2026-04-30 · 文章

三星芯片利润暴涨近 50 倍至 53.7 万亿韩元，预警 2027 年供应缺口将进一步扩大

samsungsemiconductorhbmai-infrastructuresupply-chain

4.0 · 优秀开发者

Infra 2026-04-28 · 文章

华为昇腾 AI 芯片 2026 年营收预计达 120 亿美元，同比增长 60%

huaweiascendai-chipsemiconductorchina

4.0 · 优秀开发者

Business 2026-04-28 · 文章

OpenAI 携 GPT-5.5 入驻 AWS Bedrock，结束微软七年独家云托管

OpenAI 与 AWS 联合宣布 GPT-5.5、Codex 编程代理及 Bedrock Managed Agents 进入有限预览。此前微软与 OpenAI 重签合作协议，取消 Azure 独家许可、废除 AGI 条款。GPT-5.4 已可调用，GPT-5.5 将在未来两周内上线。AWS 客户可通过现有 Bedrock API 调用 OpenAI 模型，复用统一的安全与治理框架。云计算 AI 模型市场从"独家绑定"转向"多平台分发"。

openaiawsbedrockgpt-5.5cloudmulti-cloud

4.0 · 优秀产品/创业

Agents 2026-04-28 · 文章

MCP crossed 97 million monthly SDK downloads in March 2026

MCP（Model Context Protocol）2026 年 3 月 SDK 月下载量突破 9700 万次。该协议从 Anthropic 内部实验到 Linux 基金会 Agentic AI Foundation 托管仅用约 14 个月，速度超过任何已知开发者协议。文章提供生产级 MCP Agent 构建指南，涵盖服务器/客户端实现、安全策略和 2026 年路线图。

MCPModel Context ProtocolagenticAnthropicprotocol

4.0 · 优秀开发者

Watchlist

趋势标签

专题

agent llm claude openclaw coding paper ai-tools openai reasoning codex claude-code mcp multi-agent memory anthropic Agent workflow Android

Tools

工具与项目

Tools 4.0 · 优秀

OpenAI DevDay门票抽奖

使用GPT-5.5和Image Gen构建项目，每周选出2-3个最佳项目赢得免费DevDay 2026门票，提供实践AI前沿技术的机会。

2026-05-01 · X · OpenAI

Tools 3.0 · 值得看

深度调研：DroidClaw vs Open-AutoGLM

2026-05-01 · 文章

Tools 3.0 · 值得看

从历史 Luddites 看反 AI 数据中心运动：1816 年的教训

2026-05-01 · 文章

Tools 3.0 · 值得看

三步搭好

标签打好，结构理清，交叉链接也做了两个月后标签过时了没人改，断链了没人修. 新笔记往里一扔就不管了再过两个月打开一看，一堆垃圾然后重建. 所有人的第二大脑都是这么死的：维护太累了，累到比写笔记本身还累但有少数人已经跳出这个循环了. 他们的知识库是复利的：每天都在变厚，喂给 AI 的上下文每天都在变好，输出质量每天都在拉开差距他们用的方法来自 Karpathy. 就是那个 OpenAI 创始团队、前 Tesla AI 总监的 Karpathy. 这条推文几天跑了几千万曝光核心思路一句话：让 Claude Code 替你维护 Wiki 我花了几天把围绕这套方法的内容翻了个遍. 怎么安装

2026-05-01 · 文章

Tools 3.0 · 值得看

where this started

BUT there's a level most people are missing. 3 million views on Ole Lehmann's article alone. - thousands of people running it to make real decisions. - the idea is genuinely brilliant: > instead of asking one AI a question and trusting whatever comes back, you force multiple perspectives to argue, r

2026-05-01 · 文章

Tools 3.0 · 值得看

geohot：AI 没有护城河，模型折旧比想象中快，中国没有 AI 狂热

Source: geohot | 2026-04-22 URL: io/blog/jekyll/update/2026/04/22/ai-has-no-moat. html geohot 撰文称「AI 没有护城河」. 核心论点：Cursor 60B 估值收购是因为 FOMO，实际没人真正用；opencode 确实是最好的 coding agent 但写一个类似的并不难；真正的壁垒在模型，但模型折旧极快，开源已有详细训练指南. 1）的 10 倍，但能力差距只有约 6 个月. 判断「AGI singularity」是硅谷特有狂热，中国 AI 是正常指数增长曲线，AI

2026-05-01 · 文章

Tools 3.0 · 值得看

f716dadc

《Harness Engineering——Claude Code 设计指南》：不是源码注释汇编，也不是产品功能介绍. 它关注的是 Claude Code 如何把不稳定模型收束进可持续运行的工程秩序，让控制面、主循环、工具权限、上下文治理、恢复路径、多代理验证与团队制度长成一套完整骨架《Claude Code 和 Codex 的 Harness 设计哲学——殊途同归，还是各表一枝》：比较两套 AI coding harness，最容易犯的错误，是拿一张功能对照表当作思想史. 左边写“有技能”，右边也写“有技能”；左边写“有沙箱”，右边也写“有沙箱”；左边写“能开子代理”，右边也写“能开子

2026-05-01 · 文章

Tools 3.0 · 值得看

bc88936b

Claude blog: Usage patterns and customer examples - Engineering blog: The design of Claude Managed Agents - Docs: Onboarding, quickstart, overview of the CLI and SKDs Why Claude Managed Agents The Claude messages API is a direct gateway to the model: it accepts messages and returns content blocks

2026-05-01 · 文章